فیلترکردن هرزنامه ها با استفاده از تکنیک های یادگیری ماشین

پایان نامه
چکیده

امروزه با توجه به فراگیری استفاده از نامه های الکترونیکی مسأله ای به نام هرزنامه ها به وجود آمده که علاوه بر هدر دادن زمان کاربران، مشکلات دیگری از جمله تحت تاثیر قرار دادن پهنای باند و استفاده ی نادرست از فضای ذخیره سازی را به همراه دارد. لذا، طراحی سیستم های کارا جهت فیلترکردن موثر هرزنامه ها از اهمیت فوق العاده ای برخوردار است. در این پایان نامه، هدف تجزیه و تحلیل، طراحی و پیاده سازی یک سیستم کارا و انعطاف پذیر مقابله با هرزنامه ها مبتنی بر روش های آماری و یادگیری ماشین است. در این راستا، با توجه به پیچیدگی های ذاتی مسأله ی فیلترکردن هرزنامه ها و به کارگیری مستمر روش های بدیع توسط تولیدکنندگان هرزنامه ها جهت جلوگیری از تشخیص و شناسایی این گونه ایمیل ها، تاکید بر استفاده از معماری های چند لایه ای ترکیبی به جای دسته بندی کننده های منفرد است. ویژگی های سیستم پیشنهادی? فیلترکردن هرزنامه، عبارت های موجود در متن ایمیل ها بوده و از آنجا که تعداد این ویژگی ها بسیار زیاد است، یک روش ترکیبی انتخاب ویژگی به منظور پیدا کردن زیرمجموعه ی بهینه ی ویژگی ها به کار گرفته شده است. برای دسته بندی ایمیل ها یک روش ترکیبی مبتنی بر الگوریتم های درخت تصمیم، ماشین بردار پشتیبان و پرسپترون چندلایه معرفی شده و روی مجموعه داده ی lingspam پیاده سازی شده است. نتایج به دست آمده نشان دهنده ی کارایی بالای سیستم نسبت به دسته بندی کننده های منفرد است. صحت اندازه گیری شده برابر 99 درصد است.

منابع مشابه

سیستم هوشمند فیلترکردن هرزنامه با استفاده از الگوریتم های یادگیری ماشین

افزایش کاربران ایمیل، منجر به افزایش چشمگیر هرزنامه ها در طی سال های اخیر شده است. تولید کنندگان هرزنامه همواره تلاش می کنند که راهکارهای به روزتری به منظور گریز از فیلترهای موجود بیابند. بنابراین ضرورت دارد که فیلترهای جدیدی متناسب با این هرزنامه ها توسعه یابد. عموماَ مهم ترین ابزار به منظور فیلترکردن هرزنامه ها بر اساس طبقه بندی متون کار می کنند. تاکنون روش های زیادی به منظور مقابله با هرزنامه...

تشخیص چهره با استفاده از تکنیک های یادگیری ماشین

تصاویر شامل چهره برای تعامل هوشمند انسان کامپیوتر و کاربردهایی در حوزه ی پردازش چهره شامل شناسایی چهره، شناسایی حالات چهره، ردیابی چهره، تشخیص جنسیت و نژاد و موارد بسیار دیگر ضروری است. بسیاری از کاربردهای ذکر شده مکان چهره در تصاویر را تعیین شده فرض می کنند؛ ازاین رو به منظور ساخت سیستم خودکاری که اطلاعات درون یک تصویر چهره را تحلیل کند، الگوریتم های مقاوم و موثر تشخیص چهره مورد نیاز است. درحق...

تخمین درصد چربی بدن افراد با استفاده از تکنیک ‌های یاد گیری ماشین

 مقدمه: پزشکان با استفاده از دستگاه BIA (Bioelectrical Impedance  Analysis) نسبت به محاسبه درصد چربی بدن افراد مبادرت می ­نمایند. مطالعه حاضر با هدف تخمین درصد چربی بدن افراد بدون استفاده از دستگاه صورت گرفته است. در این پژوهش سعی شده است که با استفاده از شبکه عصبی به پیش بینی میزان چربی بدن افراد پرداخته شود. مواد و روش ­ها:داده مورد استفاده در این تحقیق اطلاعات بیماران مراجعه کننده به یکی از...

متن کامل

دسته‌بندی کور کدهای فضا-زمان با استفاده از یادگیری ماشین

مهم‌ترین خصوصیتی که شناسایی کور کدهای فضا-زمان را از سایر انواع شناسایی کور مخابراتی متمایز می‌کند این است که برای نفوذ در بسیاری از سامانه‌های مخابراتی مدرن که از روش‌های ارسال و دریافت چندآنتنی استفاده می‌کنند، اولین قدم شناسایی کور کد فضا-زمان به‌کاررفته است. در این مقاله، دسته‌بندی کور در مجموعه وسیعی از کدهای فضا-زمان با استفاده از ابزارهای یادگیری ماشین مورد بررسی قرار گرفته است. از آنجا ...

متن کامل

تحلیل نوسان قیمت سهام شرکت های بورس اوراق بهادار تهران با استفاده از روش یادگیری ماشین

تغییرات قیمت سهام یکی از مهم‌ترین موضوعات مورد توجه هر سرمایه‌گذار است. سرمایه‌گذارانی که با اهداف بلند مدت نیز سرمایه‌گذاری می‌کنند به نوعی به قیمت سهم و تغییرات آن حساس و از خود واکنش نشان می‌دهند. تغییرات قیمت یک منبع مهم اطلاعاتی و مؤثر در ارزیابی وضعیت بنگاه‌ها. ارزیابی تطبیقی با سایر واحدها. ارزیابی کارآیی میران و از همه مهم‌تر مؤثر بر تصمیمات سرمایه‌گذاران است. هدف پژوهش پیش‌بینی نوسان ق...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شهید چمران اهواز - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023